Telegram Group Search
Forwarded from Machinelearning
⚡️ Claude получила возможность веб-поиска.

Anthropic объявила о запуске новой функции веб-поиска для Claude. Теперь ИИ способен анализировать актуальные данные из интернета, предоставляя ответы с прямыми ссылками на источники. Это позволяет не только повысить достоверность информации, но и упростить проверку фактов.

Поиск доступен в режиме Preview для платных подписчиков в США, но в ближайшие месяцы ожидается глобальное расширение. Для активации ye;yj включить опцию в настройках профиля и начать диалог с Claude 3.7 Sonnet — система сама определит, когда требуется обращение к веб-источникам
anthropic.com

✔️ Hugging Face запустил приложение HuggingSnap: оффлайн-ИИ для анализа окружения через камеру iPhone.

Hugging Face представила приложение HuggingSnap для iOS, использующее локальную Smolvlm2 для анализа изображений в реальном времени без подключения к сервису. В отличие от облачных аналогов, HuggingSnap обрабатывает данные исключительно на устройстве, экономя заряд устройства и гарантируя конфиденциальность. Пользователи могут получать описания объектов, сцен, текстов и сложных визуальных контекстов.

Для работы требуется iOS 18, но приложение также совместимо с macOS и Apple Vision Pro. По словам разработчиков, HuggingSnap-это пример, как локальный ИИ может стать повседневным инструментом.
techcrunch.com

✔️ Google добавит Gemini AI в Chrome, повторяя опыт Copilot для Windows 11

Google активно тестирует интеграцию ИИ-ассистента Gemini в браузер Chrome, стремясь вывести его за рамки веб-сайта. Как выяснили исследователи, функционал разместят в верхней части окна — рядом с кнопками управления. В настройках появится возможность назначить горячие клавиши или активировать ассистент через меню. При запуске Gemini будет открываться в отдельном плавающем окне. Кроме того, Google планирует вынести иконку ассистента в системный трей — запускать его можно будет прямо с панели задач, хотя для работы потребуется активный Chrome.

Пока функция доступна лишь в экспериментальных сборках, а ее стабильность оставляет желать лучшего. Ясно одно - Google намерен конкурировать с Microsoft, предлагая свой подход к интеграции ИИ в повседневные инструменты.
windowslatest

✔️ AudioX: универсальная модель генерации звука и музыки через кросс-модальные преобразования.

Moonshot AI совместно с Гонконгским университетом анонсировали AudioX — универсальную модель на базе Diffusion Transformer, способную генерировать высококачественное аудио и музыку из текста, видео, изображений или их комбинаций. Главная инновация — стратегия маскирования входных данных, которая усиливает обучение кросс-модальных представлений.

Возможности AudioX: генерация любых звуков на основе текста, видео и их комбинаций (текстовый промпт к видео), восстановление "потерянной" части аудио, генерация музыки на основе текста, видео и их комбинации и "аутпейнт" существующего аудио.

Тесты AudioX: лучшая в 15+ задачах, включая генерацию звука по видео (VGGSound) и создание музыки по тексту (MusicCaps). На FAD и KL-дивергенции модель показала улучшение на 12–35% против Tango 2 и AudioLDM.
Веса и код - coming soon.
zeyuet.github

✔️ Microsoft Research разработал Claimify: инструмент фактчекинга ИИ

Microsoft Research представил Claimify — систему, которая решает проблему недостоверных ответов ИИ, извлекая из текстов только верифицируемые утверждения. Метод основан принципах: исключение субъективных суждений, сохранение критического контекста, устранение двусмысленностей, самостоятельность утверждений и др. Результаты тестов показывают, что 99% утверждений, извлечённых Claimify, полностью соответствуют исходному контексту.
microsoft

✔️ RF-DETR: новая SOTA для обнаружения объектов в реальном времени с открытым исходным кодом.
Это первая модель, работающая а реальном времени: 60+ mAP на COCO. SOTA на бенчмарке RF100-VLRF-DETR.
Github

✔️ Same New - нейросеть копирует любой сайт с точностью до пикселя — по одной ссылке воспроизводит весь интерфейс, структуру, анимации, изображения и даже интерактивные элементы.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
PiEEG kit - bioscience Lab in home for your Brain and Body

🖥 Github: https://github.com/pieeg-club/PiEEG_Kit

📕 Paper: https://arxiv.org/abs/2503.13482

🌟 Methods: https://paperswithcode.com/task/eeg-1

@ArtificialIntelligencedl
Please open Telegram to view this post
VIEW IN TELEGRAM
FastCuRL: Curriculum Reinforcement Learning with Progressive Context Extension for Efficient Training R1-like Reasoning Models

🖥 Github: https://github.com/nick7nlp/FastCuRL

📕 Paper: https://arxiv.org/abs/2503.17287v1

🌟 Tasks
: https://paperswithcode.com/task/language-modeling

@ArtificialIntelligencedl
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Harnessing the Reasoning Economy: A Survey of Efficient Reasoning for Large Language Models

🖥 Github: https://github.com/devoallen/awesome-reasoning-economy-papers

📕 Paper: https://arxiv.org/abs/2503.24377v1

@ArtificialIntelligencedl
Please open Telegram to view this post
VIEW IN TELEGRAM
Effect-driven interpretation: Functors for natural language composition

🖥 Github: https://github.com/UCSC-VLAA/MedReason

📕 Paper: https://arxiv.org/abs/2504.00993v1

🔗 Tasks: https://paperswithcode.com/task/knowledge-graphs

@ArtificialIntelligencedl
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
REPA-E: Unlocking VAE for End-to-End Tuning of Latent Diffusion Transformers

🖥 Github: https://github.com/End2End-Diffusion/REPA-E

📕 Paper: https://arxiv.org/abs/2504.10483

🔗 Dataset: https://paperswithcode.com/dataset/imagenet

@ArtificialIntelligencedl
Please open Telegram to view this post
VIEW IN TELEGRAM
ReSpec: Relevance and Specificity Grounded Online Filtering for Learning on Video-Text Data Streams

🖥 Github: https://github.com/cdjkim/respec

📕 Paper: https://arxiv.org/abs/2504.14875v1

🔗 Dataset: https://paperswithcode.com/task/informativeness

@ArtificialIntelligencedl
Please open Telegram to view this post
VIEW IN TELEGRAM
UniVLA: Learning to Act Anywhere with Task-centric Latent Actions

🖥 Github: https://github.com/opendrivelab/univla

📕 Paper: https://arxiv.org/abs/2505.06111v1

🔗 Dataset: https://paperswithcode.com/dataset/room-to-room

@ArtificialIntelligencedl
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Deliberation on Priors: Trustworthy Reasoning of Large Language Models on Knowledge Graphs

🖥 Github: https://github.com/reml-group/deliberation-on-priors

📕 Paper: https://arxiv.org/abs/2505.15210v1

@ArtificialIntelligencedl
Please open Telegram to view this post
VIEW IN TELEGRAM
SpatialScore: Towards Unified Evaluation for Multimodal Spatial Understanding

🖥 Github: https://github.com/haoningwu3639/SpatialScore

📕 Paper: https://arxiv.org/abs/2505.17012v1

🔗 Tasks: https://paperswithcode.com/task/motion-estimation

@ArtificialIntelligencedl
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
7 июня — идеальный день, чтобы NLP-специалисту получить оффер мечты! 😉

Сразу две команды Сбера: «Стратегия и развитие» и AI Solutions, — приглашают вас принять в One Day Offer по профилю NLP/LLM.

Вы будете работать в гибридном формате: обучать и улучшать языковые модели, разрабатывать AI-помощника и ML-модели, а ещё анализировать процессы всего банка. Звучит круто, на деле тоже круто!

Отмечайте в календаре 7 июня, 10:00, регистрируйтесь по ссылке и готовьтесь к резкому карьерному виражу! 👌
EmergentTTS-Eval: Evaluating TTS Models on Complex Prosodic, Expressiveness, and Linguistic Challenges Using Model-as-a-Judge

🖥 Github: https://github.com/boson-ai/emergenttts-eval-public

📕 Paper: https://arxiv.org/abs/2505.23009v1

🔗 Tasks: https://paperswithcode.com/task/text-to-speech-1

@ArtificialIntelligencedl
Please open Telegram to view this post
VIEW IN TELEGRAM
Bagged Deep Image Prior for Recovering Images in the Presence of Speckle Noise

🖥 Github: https://github.com/Computational-Imaging-RU/Bagged-DIP-Speckle

📕 Paper: https://arxiv.org/abs/2505.23594v1


@ArtificialIntelligencedl
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥 Успех в IT = скорость + знания + окружение

Здесь ты найдёшь всё это — коротко, по делу и без воды.
Пока другие ищут, где “подглядеть решение”, ты уже используешь самые свежие инструменты!

AI: www.tg-me.com/ai_machinelearning_big_data
Python: www.tg-me.com/pythonl
Linux: www.tg-me.com/linuxacademiya
Собеседования DS: www.tg-me.com/machinelearning_interview
C++ www.tg-me.com/cpluspluc
Docker: www.tg-me.com/DevopsDocker
Хакинг: www.tg-me.com/linuxkalii
Devops: www.tg-me.com/DevOPSitsec
Data Science: www.tg-me.com/data_analysis_ml
Javascript: www.tg-me.com/javascriptv
C#: www.tg-me.com/csharp_ci
Java: www.tg-me.com/java_library
Базы данных: www.tg-me.com/sqlhub
Python собеседования: www.tg-me.com/python_job_interview
Мобильная разработка: www.tg-me.com/mobdevelop
Golang: www.tg-me.com/Golang_google
React: www.tg-me.com/react_tg
Rust: www.tg-me.com/rust_code
ИИ: www.tg-me.com/vistehno
PHP: www.tg-me.com/phpshka
Android: www.tg-me.com/android_its
Frontend: www.tg-me.com/front
Big Data: www.tg-me.com/bigdatai
МАТЕМАТИКА: www.tg-me.com/data_math
Kubernets: www.tg-me.com/kubernetc
Разработка игр: https://www.tg-me.com/gamedev
Haskell: www.tg-me.com/haskell_tg
Физика: www.tg-me.com/fizmat

💼 Папка с вакансиями: www.tg-me.com/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: www.tg-me.com/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: www.tg-me.com/addlist/eEPya-HF6mkxMGIy
Папка ML: https://www.tg-me.com/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: https://www.tg-me.com/addlist/mzMMG3RPZhY2M2Iy

😆ИТ-Мемы: www.tg-me.com/memes_prog
🇬🇧Английский: www.tg-me.com/english_forprogrammers
🧠ИИ: www.tg-me.com/vistehno

🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
📕Ит-книги бесплатно: https://www.tg-me.com/addlist/BkskQciUW_FhNjEy

Подпишись, если хочешь быть в числе тех, кого зовут в топовые проекты!
2025/06/13 09:44:45
Back to Top
HTML Embed Code: